Une démonstration d’un crawler intelligent pour les applications Web
نویسندگان
چکیده
We demonstrate here a new approach to Web archival crawling, based on an applicationaware helper that drives crawls of Web applications according to their types (especially, according to their content management systems). By adapting the crawling strategy to the Web application type, one is able to crawl a given Web application (say, a given forum or blog) with fewer requests than traditional crawling techniques. Additionally, the application-aware helper is able to extract semantic content from the Web pages crawled, which results in a Web archive of richer value to an archive user. In our demonstration scenario, we invite a user to compare application-aware crawling to regular Web crawling on the Web site of their choice, both in terms of efficiency and of experience in browsing and searching the archive.
منابع مشابه
Recherche sémantique basée sur l'ontologie modulaire et le raisonnement à base de cas
Résumé : Les ontologies ont contribué à l’apparition des moteurs de recherche sémantiques. Parmi ceux-ci, les moteurs de recherche contextuels se basent sur un nombre déterminé d’ontologie de domaine. La recherche dans ces moteurs est limitée à un domaine bien déterminé. Ainsi, au dessus d’un crawler, plusieurs techniques peuvent être développées pour ajouter à tout moteur de recherche traditio...
متن کاملDéfinition d'un agent conversationnel assistant d'applications internet à partir d'un corpus de requêtes
RÉSUMÉ. Les Agents Conversationnels Assistants sont une sous-classe des Agents Conversationnels Animés, dédiée à la Fonction d’Assistance pour les applications et services du grand public. Les nouvelles applications Internet sont un domaine particulièrement intéressant pour étudier les agents assistants pour le grand public. Nous avons donc développé un logiciel orienté Web, appelé le « toolkit...
متن کاملUne méthode de rétro-ingénierie des processus métier basée sur un métamodèle multi-vues
RÉSUMÉ. Dans le contexte actuel de la mondialisation et dans le besoin croissant de l’automatisation du travail, la modélisation des processus métier devient une nécessité pour non seulement comprendre et maîtriser les processus mais également prévoir tout changement et construire ainsi une structure flexible. Pour les organisations qui possèdent des processus métier opérationnels non modélisés...
متن کاملDémonstration combinatoire de la formule de Harer–Zagier
Résumé. On donne une démonstration combinatoire directe de la formule de Harer–Zagier sur les nombres εg(m) de manières d’obtenir une surface de Riemann de genre g par identification par paires des côtés d’un 2m-gone. Cette formule est la clé combinatoire nécessaire pour le calcul de la caractéristique d’Euler de l’espace de modules des courbes de genre g. La méthode ici développée reprend l’ap...
متن کاملEvaluation d'associations sémantiques dans une ontologie de domaine
Résumé : Dans une ontologie de domaine, une association sémantique entre deux entités (concepts, attributs d’un concept) est une représentation d’un chemin ou d’un lien sémantique (LS) indirect entre elles. Un défi prometteur pour le Web sémantique est de développer des méthodes pour découvrir des données fortement liées dans un nombre important d’associations sémantiques rassemblées à partir d...
متن کامل